AI资讯新闻榜单内容搜索-LLM

R1一周年，DeepSeek Model 1悄然现身

2025 年 1 月 20 日，DeepSeek（深度求索）正式发布了 DeepSeek-R1 模型，并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中，DeepSeek-R1 也是该平台上获赞最多的模型。

来自主题: AI资讯

11664 点击 2026-01-21 09:51

让Agent记住一切是愚蠢的：SimpleMem用「结构化语义压缩」登顶记忆SOTA

如果人类的大脑像现在的LLM Agent一样工作，记住每一句今天明天的废话，我们在五岁时就会因为内存溢出而宕机。真正的智能，核心不在于“存储”，而在于高效的“遗忘”与“重组”。

来自主题: AI技术研报

9627 点击 2026-01-15 09:22

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

站在 2026 年的开端回望，LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年，Transformer 架构以绝对的统治力横扫了人工智能领域，但随着算力成本的博弈和对推理效率的极致追求，挑战者们从未停止过脚步。

来自主题: AI技术研报

10314 点击 2026-01-14 15:25

拖拽式搭建分布式Agent工作流！Maze让非技术人员几分钟搞定复杂任务

在大模型智能体（LLM Agent）落地过程中，复杂工作流的高效执行、资源冲突、跨框架兼容、分布式部署等问题一直困扰着开发者。而一款名为Maze的分布式智能体工作流框架，正以任务级精细化管理、智能资源调度、多场景部署支持等核心优势，为这些痛点提供一站式解决方案。

来自主题: AI资讯

9272 点击 2025-12-30 15:14

Agent「记吃不记打」？华为诺亚&港中文发布SCOPE：Prompt自我进化，让HLE成功率翻倍

在 LLM Agent 领域，有一个常见的问题：Agent 明明 "看到了" 错误信息，却总是重蹈覆辙。

来自主题: AI技术研报

8930 点击 2025-12-30 09:54

所有大模型，都学物理学：北大物理系一篇研究，震撼了AI圈

LLM 智能体很赞，正在成为一种解决复杂难题的强大范式。

来自主题: AI技术研报

8896 点击 2025-12-17 14:58

告别「盲目自信」，CCD：扩散语言模型推理新SOTA

扩散语言模型（Diffusion Language Models）以其独特的 “全局规划” 与并行解码能力广为人知，成为 LLM 领域的全新范式之一。然而在 Any-order 解码模式下，其通常面临

来自主题: AI技术研报

8466 点击 2025-12-13 10:59

a16z 提出 AI 产品的「水晶鞋效应」：第一批用户反而是最忠诚的

前几天，AI 推理服务供应商 OpenRouter 发布了一份报告《State of AI》，基于平台上 60 多家提供商的 300 多个模型，100 万亿个 token 的交互数据，对 LLM 的实际应用情况进行了分析。报告中，提到了一个「灰姑娘水晶鞋效应」，特别有意思。研究者在分析用户留用数据时发现一个现象：AI 模型发布第一个月进来的用户，往往比后来进来的用户留存率更高。

来自主题: AI技术研报

8735 点击 2025-12-12 16:15

Khosla 继 OpenAI 后的最大赌注，General Intuition 凭 38 亿个游戏高光片段做世界模型

今年 10 月，专注构建世界模型的 General Intuition 完成了高达 1.34 亿美元的种子轮融资。这笔融资由硅谷传奇投资人 Vinod Khosla 领投，这是他自 2019 年首次投资 OpenAI 以来开出的最大单笔种子轮投资，也标志着他在 LLM 之后对下一代智能范式做出的一次重大下注。

来自主题: AI资讯

9939 点击 2025-12-11 10:59

扩散语言模型推理太慢？北大团队提出ODB-dLLM框架，破解计算访存双重瓶颈

基于扩散的大语言模型 (dLLM) 凭借全局解码和双向注意力机制解锁了原生的并行解码和受控生成的潜力，最近吸引了广泛的关注。例如 Fast-dLLM 的现有推理框架通过分块半自回归解码进一步实现了 dLLM 对 KV cache 的支持，挑战了传统自回归 LLMs 的统治地位。

来自主题: AI技术研报

7120 点击 2025-12-11 10:42